Un Método de Extracción de Equivalentes de Traducción a partir de un Corpus Comparable Castellano-Gallego

نویسندگان

  • Pablo Gamallo
  • José Ramom Pichel Campos
چکیده

So far, research on extraction of word translations from comparable, non-parallel corpora has not been very popular. The main reason was the poor results when compared to those obtained from aligned parallel corpora. The method proposed in this paper, relying on seed contexts generated from external bilingual dictionaries, allows us to achieve results similar to those from parallel corpus. In this way, the huge amount of comparable corpora available via Web can be viewed as a never-ending source of lexicographic information. In this paper, we desbribe the experiments performed on a comparable, Spanish-Galician corpus.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

XTRA-Bi: Extracción automática de entidades bitextuales para software de traducción asistida

Resumen: El principal inconveniente de los sistemas de memorias de traducción es que para que lleguen a ser productivos requieren un costoso proceso previo de alimentación manual. XTRA-Bi desarrolla métodos de extracción y alimentación automática de segmentos bilingües a partir de corpora paralelos. La clave del método radica en la utilización del formato TMX para la importación de corpus previ...

متن کامل

Impacto de la ironía en la minería de opiniones basada en un Léxico Afectivo

En este art́ıculo se describe un método sistemático que identifica la polaridad de textos en Español, aśı como el impacto de la irońıa en la mineŕıa de opiniones. Se propone una aproximación basada en un aprendizaje automático y en la extracción de caracteŕısticas a partir de un Léxico Afectivo en Español. Fue necesaria la creación de un corpus para el entrenamiento y evaluación del método propu...

متن کامل

Avivavoz: Tecnologías Para La Traducción De Voz

AVIVAVOZ es un proyecto de tres años dirigido a la investigación avanzada en todas las tecnologías clave que intervienen en un sistema de traducción de voz (reconocimiento, traducción y síntesis de voz). El objetivo del proyecto es lograr avances reales en todos los componentes de un sistema de traducción de voz para alcanzar sistemas de intermediación oral entre personas en las lenguas oficial...

متن کامل

MorphTrans: un lenguaje y un compilador para especificar y generar módulos de transferencia morfológica para sistemas de traducción automática

Resumen Este art́ıculo presenta un lenguaje para especificar las reglas de un módulo de transferencia morfólogica para un sistema de traducción automática (TA) aśı como el compilador que se tiene que utilizar para convertir esta especificación en un programa ejecutable. El módulo de transferencia morfológica trabaja sobre la salida que produce un analizador morfológico seguido de un desambiguado...

متن کامل

Ampliación de WordNet mediante extracción léxica a partir de un diccionario de sinónimos

1. Introducción El objetivo del experimento presentado en este trabajo es la expansión del WordNet gallego mediante extracción léxica a partir de un diccionario de sinónimos de esta lengua. El experimento se realiza dentro del proyecto coordinado SKATeR en el que nuestro grupo tiene como objetivo prioritario la construcción de Galnet, la versión gallega del WordNet 3.0. El marco de desarrollo e...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 39  شماره 

صفحات  -

تاریخ انتشار 2007